Skip to content

Add IO#set_encoding_by_bom since 2.7.0#2275

Merged
znz merged 1 commit intorurema:masterfrom
pocke:IO#set_encoding_by_bom
May 26, 2020
Merged

Add IO#set_encoding_by_bom since 2.7.0#2275
znz merged 1 commit intorurema:masterfrom
pocke:IO#set_encoding_by_bom

Conversation

@pocke
Copy link
Copy Markdown
Member

@pocke pocke commented May 26, 2020

#2071

Ruby 2.7 で追加された IO#set_encoding_by_bom のドキュメントを追加します。

RDoc: https://docs.ruby-lang.org/en/2.7.0/IO.html#method-i-set_encoding_by_bom

サンプルコードはRDocのものをベースに、FIle.openにブロックを渡す形にしたり、読み込んだ文字列のencodingを明示したりしています。

Comment thread refm/api/src/_builtin/IO
自身が BOM から始まる場合、BOM を読み進めて外部エンコーディングをセットし、セットしたエンコーディングを返します。
BOM が見つからなかった場合は nil を返します。

自身がバイナリモードでないかすでにエンコーディングがセットされている場合、例外が発生します。
Copy link
Copy Markdown
Member Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

実際にはArgumentErrorが発生するようですが、RDocの方に例外クラスが明示されていなかったので、るりまでもクラスは書かないようにしています

@znz znz merged commit baf3fc9 into rurema:master May 26, 2020
@znz
Copy link
Copy Markdown
Member

znz commented May 26, 2020

とりあえず良さそうだったのでマージしてしまいましたが、 UTF-8 以外 (UTF-16?) の例もあると良いかもしれません。

@pocke pocke deleted the IO#set_encoding_by_bom branch May 26, 2020 14:33
@pocke
Copy link
Copy Markdown
Member Author

pocke commented May 26, 2020

複数のエンコーディングの例があっても大して情報は増えない(BOMとエンコーディングが変わっただけで後は同じ)なので、足さなくていいかなと思っています。

一方、BOMのない非ASCII文字が含まれているテキストに対してset_encoding_by_bomを呼び出す例はあってもよいかなあと、コメントを受けて考えています

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants